零基础入门:从0到1学会apache Flink

  1. Flink是如何部署的

  2. Flink 和Spark、Storm区别

  3. Flink特点

  4. Flink Runtime 层的主要架构是什么

  5. Flink Runtime Master 组件有哪些?分别有什么作用

  6. Flink 资源有哪些模式

  7. Flink Session 模式适用什么类型任务

  8. Flink Per-Job 模式适用什么类型任务

  9. Flink Session 模式下任务提交流程是怎样的

  10. Flink Per-Job 模式下任务提交流程是怎样的

  11. Flink 资源管理模式和与作业调度是怎样的

  12. Flink 任务 Slot 选择策略

  13. Flink 中按什么顺序来调度 Task 的

  14. Flink 中资源管理的实现是什么过程

  15. Flink 中JobManager 是如何申请 Task 的资源的?

  16. Flink Task 结束,Slot释放流程是怎样的

  17. Flink Slot结束为什么使用延时释放

  18. Flink 如何解决 Slot可能存在的状态不一致问题

  19. Flink 中 Task 执行错误,如何恢复错误

  20. Flink 中集群的 Master 进行发生异常如何恢复

  21. Flink 后续版本大概会有哪些优化和扩展

  22. Flink Api主要分为几层

  23. Flink 中有哪些时间类型

  24. 如何判断 Flink 任务中应该使用哪种时间类型

  25. Flink中 Processing Time 和 Event Time 数据特性有什么不同

  26. Flink 中 WaterMark 作用是什么

  27. Flink 中 WaterMark 生成方式有哪些

  28. Flink 中 WaterMark 生成策略哪些?

  29. Flink WaterMark 处理流程

  30. ProcessFunction 和时间相关的功能有哪些

  31. Flink Table/SQL 如何注册一个 Table ?

  32. Flink 中默认窗口有哪些

  33. Flink 中数据进入窗口流程是怎样的

  34. Flink 窗口触发器是什么

  35. Flink 窗口触发器(Trigger)有哪些状态?

  36. Flink 窗口过滤器(Evictor)作用是什么

  37. Flink 内置窗口过滤器(Evictor)有几种

  38. 什么是 Flink State

  39. Flink State 根据状态分为几种

  40. 如何做好 State 管理

  41. Flink Checkpoint 与 state 的关系

  42. Flink KeyedState 支持哪些类型状态?

  43. Flink OperatorState 支持哪些类型状态?

  44. Flink 中什么是 keyed state

  45. Flink 中什么是 operator state

  46. Flink 原始状态和托管状态有什么区别

  47. Flink 状态 Statebackend 的分类

  48. Flink HeapKeyedStateBackend 是如何实现的

  49. Flink RocksDBStateBackend 适用场景有哪些

  50. Flink 状态持久化策略有哪些?

  51. Flink Checkpoint 执行流程详解

  52. 什么是 FLink 状态重分布

  53. Flink OperatorState 是如何重分布的

  54. Flink KeyedState 是如何重分布的

  55. Savepoint 与 Checkpoint 的区别

  56. Flink 如何实现 Checkpoint 的 EXACTLY_ONCE 语义

  57. Flink DataStream 状态过期是怎样配置的

  58. Flink 状态过期是如何清理的?

  59. Flink 有哪些运行模式

  60. JobManager 功能有哪些

  61. TaskManager 里面的主要组件有什么

  62. Flink Standalone 模式有什么特点

  63. Flink 中一个 Standalone 任务的运行过程是怎样的

  64. Flink 运行时的一些组件有什么

  65. Yarn 集群的组件有哪些

  66. Yarn 交互流程是怎样的

  67. Yarn 中任务提交流程是怎样的

  68. Flink on Yarn 中的 Per Job 模式是指什么

  69. Flink on Yarn 中的 Per Job 模式运行流程是怎样的

  70. Flink on Yarn 中的 Session 模式是什么

  71. Flink on Yarn 中的 Session 模式运行流程是怎样的

  72. Flink on Yarn 的 Session 模式和 Per Job 模式的应用场景有什么区别

  73. Flink on Yarn 有什么优缺点

  74. Kubernetes 中基础组件有哪些

  75. Kubernetes 运行流程是怎样的

  76. Kubernetes 核心概念有哪些

  77. Flink on Kubernetes 任务在 Kubernetes 上运行的步骤是怎样的

  78. Flink on Kubernetes JobManager 的执行过程是怎样的

  79. Flink on Kubernetes 交互流程是怎样的

  80. Flink on Kubernetes 中 k8s 各个组件具体的作用是什么

  81. Flink 在 K8s 上可以通过 Operator 方式提交任务吗?

  82. Flink 在 K8s 集群上如果不使用 Zookeeper 有没有其他高可用(HA)的方案?

  83. Flink on K8s 在任务启动时需要指定 TaskManager 的个数,有和 Yarn 一样的动态资源申请方式吗?

  84. 为什么要为 Flink 量身定制序列化框架

  85. 数据分析引擎面对 Java 对象存储密度较低,是怎样解决的

  86. Flink 中数据类型有哪些

  87. Flink 内部是如何表示数据类型的

  88. Flink 中 TypeInformation 有哪些类型

  89. Flink 中 TypeInformation 作用是什么

  90. Flink 的序列化过程是怎样的

  91. Flink 常见的序列化应用场景有哪些

  92. Flink 通信层的序列化是怎样的

  93. 在 Flink 通信层的序列化中,何时确定 Function 的输入输出类型

  94. 在 Flink 通信层的序列化中,何时确定 Function 的序列化 / 反序列化器

  95. 在 Flink 通信层的序列化中,何时进行真正的序列化 / 反序列化操作?

  96. Flink 对于无法序列化的类型是如何处理的

  97. Flink 序列化过程中,进行序列化操作的序列化器从何而来?

  98. Flink Pojo 的序列化与反序列化的类型规则是怎样的

  99. Flink 类型信息系统如何拓展

  100. Flink 任务执行时如何转换的

  101. Flink 任务 Program 到 StreamGraph 是怎样转化

  102. Flink 中 StreamNode 和 StreamEdge 是什么

  103. Flink 任务 StreamGraph 到 JobGraph 是怎样转化

  104. Flink 任务中为什么要为每个 operator 生成 hash 值?

  105. Flink 中每个 operator 是怎样生成 hash 值的?

  106. Flink operator 合并具体条件有哪些

  107. Flink operator 自动生成 hash 值因素有哪些

  108. Flink JobGraph 到 ExexcutionGraph 以及物理执行计划是怎样的

  109. Fink on Yarn 的缺陷具体是什么

  110. Flink Dispatcher 是什么

  111. 为什么 Flink 要引入 Dispatcher

  112. 为什么需要网络流控

  113. 网络流控是怎样实现的

  114. 静态网络限速有什么限制

  115. Flink 1.5 以前如何实现 feedback 机制?

  116. Flink 1.5 TCP 流控机制是怎样的

  117. Flink TCP-based 反压机制是怎样的

  118. Flink TCP-based 反压机制弊端有哪些

  119. Flink 是如何实现的流控机制的

  120. Flink Credit-based 反压过程是怎样的

  121. 有了动态反压,静态限速是不是完全没有作用了?

  122. Flink Metric 有哪些类型

  123. Flink 中获取 Metrics 有哪些方法

  124. 如何定位 Flink 任务运行慢的问题

  125. Metrics 是系统内部的监控,那是否可以作为 Flink 日志分析的输出?

  126. Flink Reporter 是有专门的线程吗?

  127. Flink 有哪些方式可以跟外界进行数据交换?

  128. Flink 预定义 source 和 sink 有哪些

  129. Apache Bahir 中提供了哪些 Flink connecter

  130. FlinkKafkaConsumer 中消费起始位置如何设置?

  131. FlinkKafkaConsumer 如何在不重启作业情况下动态感知新扩容的 partition

  132. FlinkKafkaConsumer offset 是如何提交的?

  133. FlinkKakfaConsumer Watermark 如何生成

  134. Flink kafka Producer 分区是怎样的

  135. Flink kafka Producer 如何达到 at-least-once 语义

  136. 在 Flink consumer 的并行度的设置是对应 topic 的 partitions 个数吗?要是有多个主题数据源,并行度是设置成总体的 partitions 数吗?

  137. 在构造 FlinkKafkaProducer 时, 如果 partitioner 传 null 的时候是 round-robin 发到每一个 partition ?如果有 key 的时候行为是 kafka 那种按照 key 分布到具体分区的行为吗?

  138. 如果 checkpoint 时间过长,offset 未提交到 kafka,此时节点宕机了,重启之后的重复消费如何保证呢?

  139. Flink operator state 以及 keyed state 有什么区别

  140. Flink Operator state 使用有哪些注意事项

  141. Flink Keyed state 使用有哪些注意事项

  142. Flink Checkpoint 使用有哪些注意事项

  143. 典型的机器学习工作流程有哪些问题

  144. Flink 如何实现对机器学习的抽象、扩展

  145. Flink TableEnvironment 组成部分有哪些

  146. Flink TableEnvironment 的适用场景有什么

  147. Flink Table API&SQL 解析验证

  148. Flink 为什么选择支持 Python

  149. Flink Python Table API 架构是怎样的

  150. Flink PythonVM 和 JavaVM 是怎样通讯的?

  151. Flink Python Table API 环境搭建流程是怎样的

  152. Flink Python Table API 作业是如何提交的

  153. 容错保证语义有哪些层次

  154. Flink 检查点保留策略有哪些

  155. Flink 作业自动重启策略有哪些

  156. Flink 在作业有变更请求, 有哪些操作可能会导致无法从检查点恢复

  157. Flink 检查点协调器是什么

  158. Flink 中检查点协调器在 Checkpoint 中作用是什么

  159. Flink 检查点信息中有哪些信息

  160. 为什么 Flink 使用轻量级分布式快照

  161. Flink 分布式快照如何切分数据流

  162. Flink 算子接收到 Barrier 会如何处理

  163. Flink Checkpoint 时,为什么要对齐 Barrier

  164. Flink Checkpoint 时,Barrier 是如何对齐的

  165. Flink Checkpoint JobMaster 执行需要做哪些检查

  166. Flink Checkpoint TaskExecutor 需要做哪些工作

  167. Flink Source/Sink 如何才能支持端到端严格一次

  168. Flink 分布式多个并发执行中如何实现端到端严格一次

  169. Flink 两阶段提交流程是怎样的

  170. Flink 为什么选择使用自主的内存管理

  171. Flink 中 Java 对象内存中是如何存储的

  172. Flink 1.10 以前的内存模型有哪些缺陷

  173. Flink TaskManager 内存模型是怎样的

  174. Flink TaskManager Flink本身使用的内存是如何分布的

  175. Flink TaskManager JVM 使用的内存是如何分布的

  176. Flink 中各个内存区块大小是在什么地方计算

  177. Flink 中各个内存区块大小是如何计算的

  178. Flink 内存结构是如何划分的

  179. Flink 中内存段是什么

  180. Flink 中内存页是什么

  181. Flink 中内存段的关键属性有哪些

  182. 字节顺序 Little Endian 和 Big Endian 有什么区别

  183. Flink 内存页是如何使用的

  184. Flink 中流任务和批任务内存申请是如何进行的

  185. Flink 中内存什么时候会释放

  186. Flink 中内存是如何释放的

  187. Flink 中调度器是什么

  188. Flink 中调度器有哪些能力

  189. Flink 中有哪些调度器

  190. Flink 作业有哪些生命周期状态

《零基础入门:从0到1学会Apache Flink》下载地址:https://developer.aliyun.com/topic/download?id=35

0%